检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 基于语义相关性分析的多模态摘要模型

林于翔, 吴运兵, 阴爱英, 廖祥文

《计算机应用》唯一官方网站 2024, 44 (1): 65-72. DOI: 10.11772/j.issn.1001-9081.2022101527

摘要（215）

HTML （2）

PDF （2804KB）（142）

多模态生成式摘要往往采用序列到序列（Seq2Seq）框架，目标函数在字符级别优化模型，根据局部最优解生成单词，忽略了摘要样本全局语义信息，使得摘要与多模态信息产生语义偏差，容易造成事实性错误。针对上述问题，提出一种基于语义相关性分析的多模态摘要模型。首先，在Seq2Seq框架基础上对多模态摘要进行训练，生成语义多样性的候选摘要；其次，构建基于语义相关性分析的摘要评估器，从全局的角度学习候选摘要之间的语义差异性和真实评价指标ROUGE （Recall-Oriented Understudy for Gisting Evaluation）的排序模式，从而在摘要样本层面优化模型；最后，不依赖参考摘要，利用摘要评估器对候选摘要进行评价，使得选出的摘要与源文本在语义空间中尽可能相似。实验结果表明，在公开数据集MMSS上，相较于MPMSE （Multimodal Pointer-generator via Multimodal Selective Encoding）模型，所提模型在ROUGE-1、ROUGE-2、ROUGE-L评价指标上分别提升了3.17、1.21和2.24个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于视觉误差与语义属性的零样本图像分类

徐戈, 肖永强, 汪涛, 陈开志, 廖祥文, 吴运兵

计算机应用 2020, 40 (4): 1016-1022. DOI: 10.11772/j.issn.1001-9081.2019081475

摘要（481）

PDF （905KB）（726）

在图像分类的实际应用过程中，部分类别可能完全没有带标签的训练数据。零样本学习（ZSL）的目的是将带标签类别的图像特征等知识迁移到无标签的类别上，实现无标签类别的正确分类。现有方法在测试时无法显式地区分输入图像属于已知类还是未知类，很大程度上导致未知类在传统设定下的ZSL和广义设定下的ZSL（GZSL）上的预测效果相差甚远。为此，提出一种融合视觉误差与属性语义信息的方法来缓解零样本图像分类中的预测偏置问题。首先，设计一种半监督学习方式的生成对抗网络架构来获取视觉误差信息，由此预测图像是否属于已知类；然后，提出融合属性语义信息的零样本图像分类网络来实现零样本图像分类；最后，测试融合视觉误差与属性语义的零样本图像分类方法在数据集AwA2和CUB上的效果。实验结果表明，与对比模型相比，所提方法有效缓解了预测偏置问题，其调和指标H在AwA2（Animal with Attributes）上提升了31.7个百分点，在CUB（Caltech-UCSD-Birds-200-2011）上提升了8.7个百分点。

参考文献 | 相关文章 | 多维度评价